FlowFake: Redes Líquidas para Detección de Deepfakes de Audio
Descubre FlowFake, la red líquida que detecta deepfakes de audio con solo 34K parámetros. Supera a modelos 300 veces más grandes en precisión y generalización.
Descubre FlowFake, la red líquida que detecta deepfakes de audio con solo 34K parámetros. Supera a modelos 300 veces más grandes en precisión y generalización.
La clonación de voz zero-shot reduce la carga de datos y mejora el ASR disártrico hasta un 11.45%. ¡Ideal para investigación!
BareWave es un sistema TTS nativo de onda que elimina representaciones intermedias. Ofrece clonación de voz con inteligibilidad y naturalidad. Escucha demos.
Descubre dots.tts, el modelo TTS de 2B parámetros que revoluciona la síntesis de voz con espacio latente continuo. Logra WER del 0.94% y latencia de 85 ms. Código abierto.